特稿 | 曹志耘:我国大规模语言调查的成就与启示【转发】
由于微信公众号推出新功能,“语言资源快讯”左边显示的名称并非原作者,而是公众号管理者,原作者将于大标题和文末显示,感谢各位读者的谅解!
一概况
本文所说的“大规模”调查是指在全国范围内,针对全国或大部分地区的语言方言开展的调查。“语言”调查是指对语言方言本体进行的调查,不包括对其分布情况、使用情况等的调查。
早在两千年前的西汉,扬雄就已记录整理了各地方言词语,历27年编成《輶轩使者绝代语释别国方言》一书,收录675个方言词条(近2000个方言词)。进入20世纪以来,有关政府机构、专家学者对我国汉语方言和少数民族语言开展了各种不同目的、不同类型、不同规模的调查研究。其中包括多次大规模、总体性的调查,现把其简要情况整理如下。
1.1高本汉《中国音韵学研究》
瑞典汉学家高本汉可以说是运用现代语言学方法调查汉语方言的第一人,他的《中国音韵学研究》所研究的汉语方言有34种(日译汉音和吴音按两种计),每种都有3000多个字音材料,“方言字汇”卷列表收录了26种方言1328个例字的字音对照。在以上方言中,有17种是他本人于1910年5月至1911年11月间在山西、陕西、甘肃、河南等地调查的,即:归化、大同、太原、文水、太谷、兴县、平阳、凤台、兰州、平凉、泾州、西安、三水、桑家镇、开封、怀庆、固始。其余17种是根据有关字典或西方传教士收集的材料整理的。尽管高本汉的调查区域局限于北方地区,调查点也比较有限,但在他那个时代,仍然称得上是大规模、系统性的调查了。(支建刚2021)
1.2赵元任和“中研院”史语所方言调查
1927年,赵元任先生开始调查吴语。自1927年至1946年期间,赵元任以及中央研究院历史语言研究所的罗常培、李方桂、杨时逢、丁声树、吴宗济、董同龢等先生先后对江浙沪(1927年)、两广(包括海南,1928-1930年)、陕南(1933年)、皖南(1934年)、江西(1935年)、湖南(1935年)、湖北(1936年)、云南(1940年)、四川(1941年和1946年)等12个省市部分地区的方言进行了大规模的调查,并出版了部分调查成果,例如《现代吴语的研究》(1928年)、《湖北方言调查报告》(1948年)、《关中方音调查报告》(1954年)、《云南方言调查报告(汉语部分)》(1969年)、《湖南方言调查报告》(1974年)、《四川方言调查报告》(1984年)。其中《湖北方言调查报告》收录了64个县的方言语音材料,并将全省方言进行比较研究,绘制了66幅方言地图。
据《湖北方言调查报告》“序”,开头几次调查“都是注重几个代表语的较详细的记录,所用的例字表较长而所调查的地方较少。到二十四年春本所拟了一个全国方言调查的总计划,打算由少数人在几年之内,给全国方言做一个粗略的初次调查,并且灌制全国的代表音档,所调查的地方要多到能够画得出方言地图来,每处所调查的材料要少到能够在几年之内就完成这计划。”可见,史语所后来的计划是要做全国范围的调查,并绘制全国汉语方言地图。可惜由于历史的原因,这项调查最终未能覆盖全国,成果也未能全部出版。
1.3全国语言方言普查(详见本文第二节)
1.4新编地方志
我国从20世纪80年代开始开展新编地方志的工作,至20世纪末共编纂省、地、县三级志书约6000部,此外还有大量的乡镇志、专业志等。(郁文1999)在新编地方志中,有相当一部分含有“方言卷”或相关内容,有些地方还编写出版了单行本的方言志(少数民族语言方面的情况不详,暂略)。新编地方志工作由地方志办公室领导,他们对方言专业以及方言志编写并不了解,因此在全国层面并无统一的规范要求,各地基本上是根据方志部门的意见和专家的意愿自行编写,不过大多会包括方言的语音系统和常用词语等基本材料。尽管未能采取统一行动,缺乏统一规范,成果也是详略各异,良莠不齐,但从全国范围来看,实际上仍然构成了一次大规模的方言调查和汇编。遗憾的是至今尚无这方面的统计数据,也没有将这批成果进行汇总利用。
1.5《中国语言地图集》
1983年6月15日,中国社会科学院和澳大利亚人文科学院签订协议,合作编写《中国语言地图集》。在李荣先生等人的领导下,经过5年的调查编写,于1987年出版了《中国语言地图集》,包括A(综合)、B(汉语方言)、C(少数民族语言)三组共36幅彩色地图,每幅地图还配有相应的文字说明。据该书“序”:“图集的材料主要依据中国学者以及海外学者近几十年,特别是近几年大规模调查和仔细研究的成果,也参考利用了前人的一些有关的著作。”这里提到的“大规模调查”是指由中国社科院语言研究所和民族研究所组织的、各地学者参与的、以语言方言分布分区为目的的调查。这种调查是针对已有知识的补充、核实和完善,因此根据各地区、各语言方言的具体情况而详略不同,调查内容也没有统一的条目。但由于要反映中国所有语言方言的分布分区状况,因此必须要了解掌握或重新调查每个县的情况,涉及的地点是相当全的。2012年,出版了《中国语言地图集》(第2版),地图增至79幅。
1.6北方话基本词汇调查
“北方话基本词汇调查”于1985年底立项,是国家社会科学“七五”规划重点项目,由陈章太、李行健两位先生牵头,全国汉语方言学界近百人参加。该项目对我国长江以北和西南地区23个省(区市)的106个汉语方言点进行了调查,调查内容包括当地概况、语音系统和3200多条词语,调查过程历时一年半。经过整理、校对和编纂,著为《普通话基础方言基本词汇集》(5卷),由语文出版社于1996年12月出版。全书收入93个点的材料,包括音系、同音字表、2645条词语和63幅方言地图。从项目启动到书稿完成历时6年,到成果出版历时11年。(胡士云2021)
1.7《汉语方言地图集》
2001年12月,“汉语方言地图集”获批为教育部人文社会科学研究“十五”规划项目和北京语言大学“十五”规划项目,由笔者牵头,国内外34所高校和研究机构57名研究人员参与。经过长达4年的实地田野调查,共完成全国各地方言调查点930个(东南部地区达到一县一点),发音人基本上是1931-1945年之间出生的男性,调查条目包括单字、词汇、语法共计1005个条目,收集到100多万条第一手方言资料。在传统的书面记录之外,还采用数字录音方式录制全部调查项目的有声语料。所有调查材料经录入、校对后,建成全部930个调查点的“汉语方言地图集数据库”,再利用绘图软件进行方言地图的绘制工作。根据调查结果,从全部调查条目中归纳出最有价值的510个地图条目,绘制成510幅方言特征分布地图,分为语音、词汇、语法3卷,其中语音卷205幅,词汇卷203幅,语法卷102幅。全部工作于2008年1月完成,2008年11月商务印书馆出版了《汉语方言地图集》。
1.8中国语言资源有声数据库建设
“中国语言资源有声数据库建设”项目由国家语言文字工作委员会领导实施。2008年10月,项目在江苏省开展试点调查工作。随后几年,上海(2011年)、辽宁(2011年)、北京(2012年)、广西(2012年)、福建(2013年)、山东(2013年)、河北(2013年)等省(区市)也相继启动。项目计划对全国各县汉语方言、各少数民族语言的常用语音词汇语法现象、日常话语、地方普通话等进行实地调查,并采用先进的录音设备和技术进行录音,建设“中国语言资源有声数据库”。2015年,随着中国语言资源保护工程的启动,有声数据库项目也一并纳入语保工程。至语保工程启动时,有声数据库项目共完成江苏等8省(区市)164点的调查工作,江苏省还编写出版了《江苏语言资源资料汇编》(19册)。
1.9中国语言资源保护工程
中国语言资源保护工程是在国务院领导指示下,由国家财政支持、教育部和国家语言文字工作委员会组织实施的重大语言文化工程,是继1956年开展全国汉语方言和少数民族语言普查以来,我国历史上第二次全国性、大规模的语言方言调查工作,也是目前世界上最大规模的语言资源保护项目。语保工程于2015年启动,一期任务于2019年底顺利完成。共完成1712个调查点,其中包括1134个汉语方言点,324个少数民族语言调查点,152个濒危少数民族语言和汉语方言点,102个语言文化点。调查范围涵盖全国所有省(区市)、123个语种及其主要方言,调查内容包括各语言方言的概况、语音、词汇、语法、话语、口头文化等内容(汉语主要包括1000个单字、1200条词汇、50个语法例句以及口头文化材料,民语主要包括3000条词汇、100个语法例句以及口头文化材料),形式包括文字、音标、音频、视频、照片等,调查对象包括老年男女、青年男女以及多名口头文化发音人。调查收集到123种语言和全国各地方言的原始语料文件数据1000多万条,其中音视频数据各500多万条,总物理容量达100TB,建成世界上最大规模的中国语言资源库和采录展示平台。同时编写出版了《中国语言资源集》(分省)、《中国濒危语言志》(50卷)、《中国语言文化典藏》(50卷)等一系列标志性成果。
语保工程二期于2021-2025年期间实施,将对一些持续濒危的语言方言开展调查,对一期所收集的语言资源进行全面系统的整理加工,并对现有的数据平台进行改造升级。
表1 我国20世纪以来大规模语言调查概况
二 全国汉语方言普查
20世纪50年代,我国开展了一次大规模的汉语方言和少数民族语言普查,这也是我国历史上第一次全国性的语言方言普查。这次普查距今已过去60多年,许多当事人已离开人世,健在者则多已年过九旬,大部分原始调查资料和成果初稿长期散落各处或已亡佚,整理出版的成果十分有限。因此,历史的真实面目已变得模糊不清。在本节里,我们通过搜寻各种相关记录、查阅所能见到的原始书稿、向亲历者咨询求证等,力图拼凑勾勒出一个相对完整的面貌,以供大家参考。
2.1汉语方言普查
1956年2月6日,国务院发布《关于推广普通话的指示》,要求:“为了帮助普通话的教学,中国科学院语言研究所……会同教育部和高等教育部,组织各地师范学院和大学语文系的力量,在1956年和1957年完成全国每一个县的方言的初步调查工作。各省教育厅应该在1956年内,根据各省方言的特点,编出指导本省人学习普通话的小册子。”
1956年3月20日,高等教育部和教育部联合发布《关于汉语方言普査工作的指示》,要求:“在1956、1957两年内把全国各地的汉语方言普查完毕。调查以市、县或相当于县的行政区域为单位,每一单位为一个调查点(以市、县人民委员会所在地的方言为调查对象)。”、“这次方言普查以帮助推广普通话为目的,着重调查语音(声、韵、调的系统,音值跟北京语音的对比),同时调查一部分词汇和语法特点。这次调查还是初步的,详细深入的调查研究,待以后再做。”、“调查所得材料,必须结合实际,应用于本地各级学校的普通话教学,并且要把方音和北京语音的对应规律及学习方法编写成书。”
关于本次汉语方言普查,政府部门或学术界并未留下一份全面具体的总结报告(至少没见到过)。我们现在所能找到的最早的记录是吕叔湘先生于1959年11月26日发表在《人民日报》上的《谈谈现代汉语规范化工作》,吕先生指出(括号里的阿拉伯数字为笔者所加):“这次方言普查以当时的县及相当于县的行政单位为调查点,共有一千八百八十点(1880)。经过两年来的努力,已经调查了一千八百二十二点(1822),写出了方言调查报告一千一百九十五种(1195),学习普通话手册三百零七种(307)。”
随后,1960年12月,丁声树先生在中国科学院哲学社会科学部学部委员会第三次扩大会议上作了一个关于方言调查研究工作的发言,后以《关于进一步开展汉语方言调查研究的一些意见》为题发表在《新建设》1961年第1期(《中国语文》1961年第3期转载)。丁先生指出:“到1958年秋季,全部方言普查工作基本上完成了。调查了1800多点,写成的调查报告将近1200份,根据方言和普通话的语音对应规律编写的方言地区人民学习普通话的手册320多种(其中正式出版的有40多种)。……从1959年起,各省区又依照教育部的指示,根据普查材料编写本地区的方言概况。就目前(1960年12月初)了解到的,有八个省区的方言概况已经编写完成。”
另据詹伯慧(1980):“当时全国除西藏外有县(市)数目2298,已普查汉语方言1849点;各省(自治区)随后编出300种以上的‘学话手册’(或‘××人怎样学习普通话’),其中已由各地方出版社出版的有72种;各省(自治区)编出的‘方言概况’一类综合性调查报告有18种”。又据王福堂(2010:41):“1956年方言普查工作在全国各省区汉语地区展开,1958年基本完成。两年多时间里,总共调查了大陆1849个市县的汉语方言。1959年起工作转入总结阶段,编写了调查报告近1200种,学话手册300余种,各省区的方言概况20种(计有河北、辽宁、黑龙江、内蒙古、山东、河南、山西、陕西、甘肃、江苏、浙江、安徽、湖北、湖南、四川、云南、贵州、福建、广东、广西等)。”
根据以上资料,我们暂且把有关数据归纳为:共完成1800多个点的普查,编写学习普通话手册300多本,单点方言调查报告约1200份,省区方言概况约20种。
2.2少数民族语言普查
1951年2月5日,中央人民政府政务院发布《关于民族事务的几项决定》,第(五)条为:“在政务院文化教育委员会内设民族语言文字研究指导委员会,指导和组织关于少数民族语言文字的研究工作,帮助尚无文字的民族创立文字,帮助文字不完备的民族逐渐充实其文字”。1954年5月,中央人民政府政务院文教文员会民族语言文字研究指导委员会及中央人民政府民族事务委员会《关于帮助尚无文字的民族创立文字问题的报告》指出:“几年来由于少数民族在政治、经济、文化各方面获得很大的发展,没有文字的或没有通用文字的民族现在迫切要求解决文字问题”,“对于没有文字或没有通用文字的民族,根据他们的自愿自择,应在经过一定时期的调查研究之后,帮助他们逐步制订一种拼音文字,或帮助他们选择一种现有的适用的文字。”
1955年12月,我国举行了首届民族语文科学讨论会。会议制定了少数民族语文工作的第一个五年计划和十二年远景规划,计划在两年内对少数民族语言开展普遍调查,在两三年内为少数民族创立和改革文字方案。1956年3月10日,国务院发布《关于各少数民族创立和改革文字方案的批准程序和实验推行分工的通知》,明确要求“中国科学院少数民族语言研究所负责作出创立和改革文字的初步设计。”
为完成上述指示任务,在中央民族事务委员会和中国科学院领导下,中国科学院少数民族语言研究所组建了7个调查工作队,共计700多名少数民族语言研究者和工作者,于1956年五六月间赴16个省区开展少数民族语言普查工作。至1959年,共调查了42个民族的语言,收集了1500多个调查点的语言资料,基本上了解了我国少数民族语言、方言、文字的种类、分布和使用情况。在此基础上,为壮、布依、黎、侗、苗、佤、哈尼、傈僳、纳西、彝10个民族设计了14种拉丁字母拼音文字方案,之后又陆续设计了载瓦、土、羌3种拼音文字方案,帮助傣、拉祜、景颇、彝4个民族改进了5种文字方案。在语言调查研究方面,20世纪60-80年代陆续出版了《中国少数民族语言简志丛书》(59种),此外还出版了一批少数民族语言方言研究专著和民汉词典,发表了少数民族语言概况类论文100多篇。(尹虎彬2019:17-18)
不过,据孙宏开(2015):“收集的语言资料初步统计约1600多个点。每个点一般有3000~4000个常用词,整理出一套音位系统,包含一套语法体系的数百个语法例句。部分调查点还记录了长篇语料。摸清了我国少数民族主要语言的分布、使用人口和使用状况、结构特点、内部差异、与周围民族语言的关系等等。”、“自1956年起至1958年,在国家民委领导下,为11个民族创制了15种文字。”两种说法略有出入,但大体相同。
2.3汉语方言普查成果辑录
汉语方言普查的基本成果即上文所说的“学习普通话手册300多本,单点方言调查报告约1200份,省区方言概况约20种”。作为我国历史上第一次全国性、大规模、系统性的方言普查,这批调查材料和成果具有无比珍贵的价值。其中,“学习普通话手册”已完成历史使命;“单点方言调査报告”无疑是很有用的,但除了个别地区(如广西)还有所保留外均已不知所终,搜集难度很大;“省区方言概况”类成果是在全面普查基础上编写的整个省(区市)的综合性、研究性成果,应该是最有价值的。正如詹伯慧(1980)所说:“这一批方言普查的成果,对于进一步深入开展汉语方言调查,也是很宝贵的资料。拿上、下两大册字数近一百多万的《福建省汉语方言概况》来看,其材料之丰富,在闽方言研究史上可谓空前”。
1979年,宋学先生曾就汉语方言普查的资料保管保存、各类成果编写出版等情况,向全国26个省(区市)的教育部门和有关专家做过一次书面调查,调查结果发表在《语文现代化》1980年第2辑上。尽管存在不全面和不准确的问题,但这可能是现存最详细的一份材料了。关于“省区方言概况”类成果的数量,丁声树(1961)说是8种(截至1960年底),詹伯慧(1980)说是18种,王福堂(2010)说是20种。宋学(1980)文中可能是沿用了丁声树先生的数据,也说是8种,不过他在表里列出的“方言概况”、“方言概要”、“语音概况”等书稿却远不止8种,其中题署时间为1960年及之前的书稿也不等于丁先生提到的那8种。在该表里,他还列出了各省(区市)的县(市)数、实际调查点数、原始材料保存情况等。近年来,我们主要以宋学先生的材料为基础,对“省区方言概况”类成果的相关情况做了力所能及的补充、核实,结果是:
“省区方言概况”类成果共涉及21个省(区市),有20项成果(江苏省和上海市合为1项),其中14项为全省方言概况、概要类,6项为全省方言语音概况、音系汇集类(不过河北、湖北虽名为“方言概况”,实际内容主要也是语音)。这20项成果中,已正式出版或发表的有4项:《河北方言概况》(河北人民出版社,1961年)、《内蒙古自治区汉语方音概况(一)》(《内蒙古大学学报》(社会科学)1963年第2期)、《江苏省和上海市方言概况》(江苏人民出版社,1960年)、《四川方言音系》(《四川大学学报》(社科版)1960年第3期(专号))。其余16项均为石印、铅印、油印、手抄的形式。鉴于相关信息散乱残缺,出入和矛盾之处甚多,搜寻也极为不易,我们汇总整理成了一个简表以供大家查阅参考。
表2 汉语方言普查综合性成果概况
三 几点启示
大规模语言调查是极富挑战性的工作,不同时代、不同国家所面对的问题和困难也不尽相同。从总体上看,我国近百年来所开展的大规模语言调查取得了巨大的成就,积累了丰富的经验,同时也存在一些缺憾。其中,20世纪50年代全国语言方言普查和2015年起开展的语保工程是世界上罕见的重大语言文化工程,值得进行全面认真的总结,以吸取经验,避免教训。在本节里,我们主要以全国语言方言普查和语保工程为对象,进行一些初步的思考和讨论。希望这里归纳的经验教训能对今后开展同类工作有所启示,同时也可为世界上其他国家地区开展相关工作提供借鉴。
3.1顺势而为,准确定位
大规模语言调查任务艰巨,需要投入大量人力财力,要想顺利实施,并取得重大成就,必须要与国家战略需求相结合,顺势而为,借力而行。不过语言毕竟不是国计民生,很难上升到国家急需或重大战略的高度,但历史上有时也会出现这种时机。
20世纪50年代,新中国刚刚成立,加强民族团结、国家统一和促进社会经济发展是国家的头等大事,而语言文字的规范和统一是达此目的的重要前提和手段。于是,现代汉语规范化、推广普通话、简化汉字、制定汉语拼音方案、摸清少数民族语言状况、创制改进少数民族文字成为这一时期的重要任务,党和政府都极为重视这些工作。例如,1955年举行了全国文字改革会议和现代汉语规范问题学术会议,1956年初成立中央推广普通话工作委员会,1956年2月6日国务院发布《关于推广普通话的指示》,1956年3月20日高等教育部和教育部联合发布《关于汉语方言普査工作的指示》。连日理万机的周恩来总理都亲自抓这项工作。据孙宏开(2015):“1956年春,各少数民族语言调查队出发在即,在中央民族学院举办训练班,周恩来总理两次亲临训练班看望大家,给所有师生以巨大鼓舞。”1958年1月10日,周总理在中国人民政治协商会议全国委员会举行的报告会上作了《当前文字改革的任务》的报告,提出了简化汉字、推广普通话、制定和推行汉语拼音方案三大任务。《关于汉语方言普査工作的指示》中甚至提出要“把方言调查当作一项政治任务”。语言文字工作尤其是语言调查工作受到如此重视,在我国历史上是空前的。
在此形势下,全国各省(区市)教育厅、各高校和广大语言方言工作者迅速行动起来,汉语方言部分仅用两年多时间就完成了全国1800多个点的调查,少数民族语言部分用4年时间就完成了全国42个民族1500多个点的调查。且不论调查质量如何,光从工作量来说,以当时的专业力量和物质条件,如果没有强大的政治支持和行政支持,是绝对不可能完成的。
语保工程则遇上了一个更大的时代背景和历史机遇。近几十年来,世界各地语言濒危现象日益严重,语言保护已成为世界性课题,联合国及许多国家对此都极为关注。联合国教科文组织把1993年定为“抢救濒危语言年”,并启动“世界濒危语言计划”,连续发布“世界濒危语言地图”,同时还通过了一系列有关语言文化保护的宣言和公约,例如《世界文化多样性宣言》(2001)、《保护非物质文化遗产公约》(2003)、《关于普及网络空间及提倡和使用多种语言的建议书》(2003)、《保护和促进文化表现形式多样性公约》(2005)。联合国则把2019年定为“国际本土语言年”,接着又把2022-2032年确定为“国际本土语言十年”。
我国在现代化和城镇化的高速进程中,少数民族语言和汉语方言也以前所未有的速度发生变化,许多语言和方言趋于濒危或面临消亡。这种严峻的形势引起了学术界的关注和社会大众的忧虑,也受到了党和政府的高度重视。2011年党的第十七届六中全会通过的《中共中央关于深化文化体制改革、推动社会主义文化大发展大繁荣若干重大问题的决定》首次提出了“科学保护各民族语言文字”的号召,2017年中共中央办公厅、国务院办公厅《关于实施中华优秀传统文化传承发展工程的意见》则提出了“保护传承方言文化”、“加强少数民族语言文字和经典文献的保护和传播”的指示。2020年,在全国语言文字会议召开之际,国务院办公厅发布《关于全面加强新时代语言文字工作的意见》,提出了更为具体、明确的要求:“保护开发语言资源。大力推进语言资源的保护、开发和利用。科学保护方言和少数民族语言文字。……建设完善国家语言资源数据库,促进语言资源的开放共享。建设网络中国语言文字博物馆。推进中国语言资源保护工程建设,打造语言文化资源展示平台等标志性成果。”
2014年初,国务院有关领导对汉语方言保护工作做出重要批示,指出汉语方言是中华传统文化的载体和地方历史文化的见证,是宝贵的文化财富,要加强对其的研究、总结,不能使之消失,这与推广普通话并不矛盾。并要求要作为抢救工程,制定时间表,切实做好汉语方言和少数民族语言的整理,包括方言故事的收集,对外国人所进行的对我语言的搜集要注意依法应对。2015年,语保工程应运而生。
不同的时代,不同的形势,两次大规模语言调查的定位全然不同。汉语方言普查的目的非常明确,就是为推广普通话服务。正如丁声树(1961)所指出的:“这次汉语方言普查有鲜明的为当前政治服务的目标,为推广以北京语音为标准音的普通话服务。”少数民族语言普查的直接目的是为少数民族创立和改革文字,同时也起到掌握语言国情,为民族识别、制定民族语文政策服务的作用。二者的总目的乃是促进语言文字规范和统一,提高各民族人民文化教育水平。语保工程的主要目的是抢救性地调查记录汉语方言和少数民族语言资源,传承弘扬中华优秀传统文化。由于定位科学准确,全国语言方言普查和语保工程都能够得以顺利实施,并取得巨大成功。至于后来少数民族新创文字命途多舛,那是另外的问题了,与普查工作无关。
3.2统筹规划,规范实施
要开展大规模语言调查,尤其是全国性的大工程,做好统一规划和顶层设计,科学制定工作规范标准,并严格管理实施,毫无疑问都是题中应有之义。事实上,如果没有规划规范,根本就寸步难行。如果规划不周全,规范不完善,也会导致事倍功半甚至前功尽弃。
语保工程成功经验之一就是重视顶层设计,统一规划规范。在工程正式启动之前的2014年,国家语委就组织专家开展工程的全面论证,论证工作持续一年之久。在充分调研、论证的基础上,形成了一个全面、完善的顶层设计方案。该方案有两个主要特点,一是全局性,二是前瞻性。全局性是指面向全国各地区、各民族、各语言、各方言进行统一规划,统一规范标准,做到地区和语言全覆盖、汉语和民语同步、语言本体和口头文化并重。前瞻性是指立足当今最新技术手段,面向未来,谋求长久保存和使用,例如除了传统的文字音标记录以外,还充分利用音像摄录手段收集高质量的音像语料,实现“音像图文影”五位一体的语料采录展示方式。
语保工程坚持“统一规范”、“标准先行”的原则。在工程启动之前和开始之初,就在以往工作的基础上,研制了一系列适用于语保工程的工作规范和技术规范。工作规范包括立项、培训、试点调查、中期检查、预验收、验收、结项、入库等各环节工作的具体规定,技术规范包括调查表、调查规范、语料整理规范、音像加工规范、属性标注规范、成果编写规范以及专用摄录软件、校验软件、标注软件等相关技术软件。所有规范经教育部语言文字信息管理司审定后,作为正式文件编印成册,统一下达至各地教育和语言文字管理部门、有关高校和科研机构遵照执行。其中《中国语言资源调查手册·汉语方言》、《中国方言文化典藏调查手册》纳入国家语委A系列绿皮书(软性规范)出版并广泛使用。这套复杂的规范标准系统对语保工程各方面、各环节的工作都做出了严格、明确的规定,保证了专业技术工作的科学性、规范性和一致性,杜绝了无据可依、各行其是的现象。
为保证语保工程高效、优质完成,有关部门制定颁布了一系列管理办法,例如《中国语言资源保护工程管理办法》、《中国语言资源保护工程专项资金管理办法》、《中国语言资源保护工程资料使用管理办法》、《中国语言资源集(分省)实施方案》等,并严格按制度实行管理。在工程一期期间,共举办全国层面的专业培训班57期,对核心专家、项目负责人、调查团队负责人、专业技术人员进行统一培训,总计达4700余人次(各地举办的二级培训未计在内)。共组织巡检25次、中期检查68次、预验收73次、验收73次。在语保调查课题的实施过程中,设立了培训、巡检、中期检查、预验收、验收等环节,每个环节均有会议、有反馈、有回头看。每年就中期检查、验收结果形成通报,由教育部语信司发至各省(区市)语言文字管理部门和项目负责人,对课题完成情况优良者提出表扬,对完成情况差的提出批评,对验收不合格或未能按时完成的课题做出撤项处理。
20世纪50年代汉语方言普查也制定了一系列工作计划、调查表,举办了多期培训班,还编印了《汉语方言调查手册》、《汉语方言调查简表》、《方言调查字表》、《方言调查词汇手册》、《古今字音对照手册》以及《汉语方言调查字音整理卡片》(共2136张),因而从总体上保证了普查工作全面快速的开展。但从整个实施过程来看,全国层面的统筹规划和管理力度明显不够,似乎基本上是由各省(区市)教育厅自行管理,各地专家自行开展。因此,各省(区市)的工作进度、完成质量、资料整理和成果出版等情况差别也很大。例如,拿调查点来说,国家要求一县一点,安徽、河南、湖北、陕西等省做到了一县一点,但内蒙古在72个县级点(未计纯牧业县)中只调查了25点,广西在74个县级点中只调查了39点。又如省区方言概况的编写,按理说全国应有统一的要求和规范,但从今天所见书稿来看,各省区的篇幅、内容、质量差异悬殊,例如福建、江苏(含上海)均达八九百页,而河南只有几十页,内蒙古已发表的则只有5页;有的包括语音、词汇、语法,有的只有语音;有的有单点音系,有的无单点音系;有的有方言地图,有的无方言地图,等等。
造成这种现象可能与管理体制有关,汉语方言普查是由高教部、教育部和中科院语言所三家单位联合牵头,由各省(区市)教育厅分头实施的,在最高层面没有一个明确的统筹全国工作的主责单位和负责人。相比之下,少数民族语言普查方面的情况就要好一些。国务院文件中明确规定了“中国科学院少数民族语言研究所负责作出创立和改革文字的初步设计”,少数民族语言的普查和文字创立改革工作都是由该所组织开展的,他们能够编写出系列性、成系统的《中国少数民族语言简志丛书》也就不奇怪了。
3.3整理利用,持续发展
大规模语言调查工作完成之后,会得到一批数量庞大的原始语料。及时对这些调查材料进行整理、加工,产出可供政府部门、社会大众和学术界使用的成果,是一项不可或缺的工作。但由于各种原因,有的项目在调查结束后,未能继续跟进相关整理加工工作,致使调查材料长期束之高阁,甚至随着时间的流逝而散失,造成极大的浪费,留下永远的遗憾。
语保工程一期对全国各语言方言开展了全面、系统、科学的抢救性调查记录,获得了海量的第一手原始语料。这批语料具有唯一性和不可迭代性,是无价之宝,亟待进行整理利用。为此,在圆满完成一期(2015-2019年)建设任务后,紧接着开展了为期5年的二期建设(2021-2025年)。二期的主要任务就是对语保工程调查收集的语言资源进行科学系统的整理加工和全面深度的开发应用,建成准确权威、开放共享的语言资源公共服务平台,产出系列标志性成果。具体而言,包括语言资源汇聚加工和开发应用两大部分。汇聚加工部分包括对一些持续濒危的语言方言开展调查保护,对工程一期所收集的语言资源进行全面系统的整理加工,并对现有的数据平台进行改造升级。开发应用部分包括编写出版语言资源集、濒危语言志等一系列标志性成果,建设语言资源公共服务平台,开发语言文化产品,提供多样化的语言服务。
“北方话基本词汇调查”项目在完成调查任务后,随之召集了一支精干的队伍,花了两年时间对调查材料进行汇总、分析、筛选、登录、查对、补充和审订,又花了两年时间进行书稿编纂和校对。整个过程历时6年,可谓一气呵成。
“汉语方言地图集”项目的调查时间为2002年12月至2006年12月,但从2005年3月起就开始了资料整理(包括录入、校对)、数据库建设和图目编写工作,至2006年底完成。2007年1月至12月,花了一年时间进行分类和画图工作,全部画图工作于2007年底完成。2008年11月正式出版《汉语方言地图集》。就地图集本身而言,工作节奏是连贯紧凑的。但是,有一项很重要的相关工作却迟迟未能完成,这就是与地图集配套的《汉语方言语料集》。由于版面和容量的限制,方言地图上只能反映最重要的、经过提炼归纳的语言特征,而难以容纳更多、更详细的语料。为了弥补地图的不足,我们原拟在地图集出版之后,组织力量编写《汉语方言语料集》,把调查所得的全部语音、词汇、语法材料以列表对照的形式或以数据库的形式提供给研究者使用。然而,由于工作重心的转移,这一计划搁置至今,每当思及则不免耿耿于怀。
赵元任和中研院史语所开展的汉语方言调查,是我国第一次利用现代语言学方法对各地区方言进行系统调查,所得材料无疑是非常珍贵的。然而,由于时处战乱年代,调查、整理和核实工作都面临很大困难,当时只整理出版了吴语和湖北两种成果,湖南、云南、四川等省的调查报告直到三四十年后才在台湾出版,白涤洲先生调查的陕西关中方言因白先生在调查次年便不幸去世,后来由喻世长先生整理出版,其他地区的调查材料命运如何则不得而知。
全国语言方言普查可谓是速战速决。汉语方言普查结束后,立即编写出了300多本各地区人学习普通话的手册,自1959年起部分省(区市)又编写了约20种省区方言概况,至于单点方言调查报告有的是工作报告,有的是同音字表,估计是随着调查同时完成的。例如甘肃,至1958年2月,两个调查工作组分别写出了22份工作报告和42份工作报告。(张文轩2020)少数民族语言普查方面,“对调查所得资料,开展了初步整理和研究工作。各工作队基本上都完成了各方言点之间的比较研究,以书面报告的形式写出了方言调查报告初稿。”(孙宏开2015)
当然,如此大规模的语言调查,后续整理、研究和开发应用工作是极为繁重的,也是大有可为的。尹虎彬(2019:18)指出:“迄今为止,大调查获取的第一手调查资料,目前只刊布了其中的一部分,尚有很多材料有待整理、刊布和深入研究。”然而,“1960年以后,由于三年自然灾害和精简机构等原因,资料的整理和编写工作都停了下来”(宋学1980),随之而来的是“文革”十年浩劫,加上近几十年里频繁的机构分合、高校搬迁、人事更迭,普查的原始资料不断散失,有些调查卡片、手稿、油印稿甚至当废品论斤卖掉,直至灰飞烟灭。以致我们今天不得不像考古工作者一样,四处搜集碎片,补缀还原。至于像广东那样,本已汇编成40多万字的《广东方言概况》书稿,交给广东省方言调查指导组保管,但还没能印出来,就已将原稿丢失(李新魁1994),只能令人抱憾永远了。
文章来源:曹志耘2023 我国大规模语言调查的成就与启示,《中国语文》第6期。
题图来源:百度图片
本期编辑/彭旭城
本期音频/彭旭城
本期审读/彭旭城
责任编辑/甘于恩
图片来源于网络与个人(侵删)
文章版权归语言资源快讯所有,转载请注明出处
投稿邮箱:jnufyzx@163.com
往期推荐
学人 | 岩田礼:关于《汉语方言地图集》和曹志耘的二三事(石汝杰译)
做语言资源保护公众号不容易,每天更新公众号更不容易,而每天提供新语料尤其不容易。很多读者还没养成打赏习惯,提倡每个月打赏一元钱,积少成多,我们的事业就有希望。谢谢各位!